AIMochi | 當 AI 開始「改變想法」:AI筆記Google、NVIDIA、ByteDance 同時押注的下一場人工智慧革命
當 AI 開始「改變想法」:AI筆記Google、NVIDIA、ByteDance 同時押注的下一場人工智慧革命

當 AI 開始「改變想法」:AI筆記Google、NVIDIA、ByteDance 同時押注的下一場人工智慧革命

在日常生活中,人類幾乎每分鐘都在做一件事:根據新資訊調整自己的判斷。

如果你正在規劃旅行,一開始可能認為「時間最重要」。
但當你看到價格差距很大時,可能會突然改變想法:「其實便宜比較重要。」

這種行為看似理所當然,但對於現代大型語言模型(LLM)來說,卻是一個極為困難的能力。

即使是目前最強大的模型,例如

  • Gemini

  • GPT‑4

  • LLaMA

在某些情況下仍然無法像人類一樣 逐步更新信念(belief updating)

這個問題長期困擾 AI 研究界。

而最近,Google 的研究團隊提出了一個可能的解決方案:讓 AI 學習「機率推理」。

這項突破,正好與另外兩個重大趨勢同時出現:

  • AI 開始能在 手機端運行

  • AI 開始能 自主完成整個專案

這三條技術路線交織在一起,正在形成一個新的 AI 時代。筆者透過 AIMochi 筆記工具,來看看 AI 圈的最新近況!

AI 的致命缺陷:大型語言模型不會更新信念

大型語言模型之所以強大,是因為它們可以模仿語言模式。

透過訓練數以兆計的文字資料,模型能夠:

  • 撰寫文章

  • 生成程式碼

  • 翻譯語言

  • 回答問題

但研究人員發現一個奇怪的現象:模型在互動中往往無法持續學習。

在一項實驗中,研究人員設計了一個簡單的情境:AI 需要幫使用者推薦航班。

每個航班都有不同特徵,例如:

  • 價格

  • 飛行時間

  • 轉機次數

AI 的任務是觀察使用者選擇,推測對方的偏好。

理論上,如果使用者多次選擇「最便宜」的航班,AI 應該逐漸理解:

這位使用者重視價格。

然而實驗結果卻顯示:

大部分模型只在第一次互動後略微改善,之後就停止學習。

研究人員將這種現象稱為:

「一次性平台期(one-shot plateau)」

換句話說,AI 在理解使用者方面幾乎沒有持續進步。

解方:讓 AI 學會貝葉斯推理

為了理解理想的學習方式,研究人員將語言模型與另一種系統進行比較。

這種系統並不是神經網路,而是一個數學模型:

Bayes' theorem

貝葉斯推理的核心概念是:

每當有新證據出現,就更新機率分布。

舉例來說:

如果 AI 一開始認為:

  • 使用者重視價格:50%

  • 使用者重視時間:50%

當使用者多次選擇便宜航班後,機率會逐漸變成:

  • 價格:80%

  • 時間:20%

這種方法在統計學與機器學習領域已經使用數十年。

令人驚訝的是:這種簡單的數學模型,表現比大型語言模型更好。

Google 的新方法:讓 AI 模仿推理過程

研究團隊提出了一個巧妙的方法。

他們並沒有直接教模型答案,而是讓模型學習:

如何進行推理。

這種方法被稱為:

Bayesian Teaching

傳統 AI 訓練方式是:

老師知道答案
→ 模型模仿答案

而在新方法中:

老師也可能不知道最終答案。

但老師會展示:

  • 推理過程

  • 假設更新

  • 機率變化

研究團隊將這些資料用於 監督式微調(Supervised Fine-Tuning)

訓練對象包括:

  • Gemma

  • LLaMA

結果非常驚人。

模型與最佳貝葉斯策略的吻合度達到:約 80%

更重要的是,模型開始展現真正的 信念更新行為

AI 的推理能力甚至超過人類

研究人員進一步測試模型的泛化能力。

新的測試包括:

  • 飯店推薦

  • 電子商務商品選擇

  • 更多決策變數

令人意外的是:

模型在某些情境下 甚至超越人類參與者

原因其實很簡單。

人類並不是完全理性的決策者。

我們常常:

  • 分心

  • 改變主意

  • 行為不一致

而經過數學推理訓練的 AI,反而更接近「理性決策模型」。

這顯示一個重要方向:

AI 未來可能結合神經網路與符號推理。

另一條戰線:AI 開始在手機上運行

與此同時,Google 也在解決另一個問題:

如何讓 AI 直接在手機上運行

為此,Google 推出了:

TensorFlow 2.21 以及新的推理引擎 LiteRT

LiteRT 是過去 TensorFlow Lite 的升級版本。

它的目標是:

讓 AI 在小型設備上運行得更快。

改進包括:

  • GPU 推理速度提升約 1.4 倍

  • 更好的 NPU 支援

  • 更簡單的模型部署流程

關鍵技術:模型量化

手機運行 AI 最大問題是:

  • 記憶體

  • 電力

  • 計算能力

解決方法之一是:

模型量化(Quantization)

簡單來說,就是:

把高精度數字壓縮成更小格式。

這樣可以:

  • 減少模型大小

  • 提高運行速度

  • 降低耗電

結果是:

更大的 AI 模型可以在手機端運行。

這意味著未來很多 AI 功能將不需要雲端。

AI 的第三條路:自主代理系統

除了推理能力與裝置端 AI,另一個快速崛起的領域是:

AI Agent

近期,ByteDance 發布了開源框架:

DeerFlow

這個系統的核心概念是:

多代理協作

一個任務可以被拆分為多個子任務:

例如:

  • 收集資料

  • 分析數據

  • 生成圖表

  • 製作簡報

不同代理同時工作,最後合併結果。

更重要的是:

DeerFlow 代理可以:

  • 運行程式碼

  • 執行命令列

  • 存取檔案

換句話說:

AI 不只是建議,而是 真正執行任務

NVIDIA 的計畫:AI 員工

同時,NVIDIA 正準備推出企業代理平台:

NemoClaw

該平台預計在 NVIDIA GTC 開發者大會公布。

根據媒體報導,NemoClaw 的目標是:

讓企業部署能替員工工作的 AI 代理。

可能合作公司包括:

  • Salesforce

  • Cisco

  • Adobe

平台將強調:

  • 安全性

  • 隱私控制

  • 企業級部署

這顯示 AI 正逐漸從工具變成:勞動力。

AI 可能正在成為「數位員工」

過去幾年,大多數人認為 AI 的未來是:

聊天機器人。

但現在的發展方向顯示另一種可能:

AI 將逐漸變成一種 工作系統

它能:

  • 推理

  • 執行任務

  • 自主完成專案

當這三項能力結合時,一個新的經濟模式可能出現:

AI Agent Economy

在這個世界裡,企業不只是雇用人類。

還會雇用:

人工智慧代理。

而這場變革,或許才剛剛開始。

以上僅供參考與資訊分享之用!若想快速了解更多資訊,透過 AIMochi 筆記工具,幫我們從海量資料中,梳理出關鍵資訊,讓我們精準掌握重要訊息!

馬上開始使用AIMochi